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(57) Abstract 

The invention concerns 
mainly a computer system for 
managing links, in particular 
hypertext links, and a method 
using such a system, characterised 
in that it comprises a server (3) 
for changing links which collects 
information on the pages (l.l), 
in particular in HTML comprising 
links, preferably external, on page 
address modifications and page 
cancellations. When a modification 
or cancellation occurs, the server 
(9) for changing links informs 
the web servers (I) concerned 
indicating the former page 
addresses. The invention is mainly 
applicable to pages comprising 
links on the World Wide Web. 

(57) Abrege* 

La presente invention se rap- 
porte principalement a un systeme 
informatique de gestion de liens, no- 
tamment de liens hypertextes, et a 

un proc6d6 mettant en oeuvre un tel systeme. Un systeme informatique selon la pr6sente invention comporte un serveur (3) de changement 
de liens qui collecte reformation sur les pages (l.l), notamment en langage HTML comprenant des liens, de pr6f6rence externes, sur 
les modifications des adresses de pages ainsi que sur les suppressions de pages. Lors d'une modification ou d'une suppression de page, 
le serveur de changement (9) de liens informe les serveurs web (l) concerned d6signant les anciennes adresses des pages. La presente 
invention s'applique principalement aux pages comportant des liens sur le World Wide Web. 
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SYSTEME INFORMATIQUE DE GESTION DES LIENS 
ET PROCEDE METTANT EN OEUVRE LEDIT SYSTEME 

La presente demande revendique la priorite de la demande 
frangaise n° 98 04660 du 15 avril 1998 qui est incorporee par references. 
5 La presente invention se rapporte principalement a un 

systeme informatique de gestion de liens, notamment de liens hypertextes, 
et a un procede mettant en oeuvre un tel systeme. 

Le reseau des reseaux INTERNET assurant I'interconnexion 
permanente des reseaux informatiques, connait un succes grandissant du, 

10 d'une part a la facilite d'acces au reseau par une connexion temporaire, 
notamment par liaison telephonique a un ordinateur d'un fournisseur 
d'acces (provider en terminologie anglo-saxonne) connecte a I'lNTERNET et, 
d'autre part, a la facilite de recherche d'informations decrites dans le 
langage de description de pages HTML d'un sous ensemble d'INTERNET 

15 appele World Wide Web ou WWW en terminologie anglo-saxonne. Les pages 
decrites en langage HTML sontinterpretees et affichees par des logiciels de 
navigation (browser en terminologie anglo-saxonne) notamment par logiciel 
NAVIGATOR® de la Societe NETSCAPE ou INTERNET EXPLORER® de la 
Societe MICROSOFT. A chaque ordinateur d'INTERNET, est assignee une 

20 adresse IP permanente ou temporaire formee d'une suite de chiffres 
separes par des points. Toutefois, pour se connecter par I'intermediaire de 
['INTERNET a un ordinateur ayant des pages en langage HTML a afficher, 
appele serveur web, il suffit a un utilisateur de connaitre son nom de 
domaine compose normalement par une chaTne de caracteres du type : 

25 http://www.xxx.com/ 

INTERNET assure le transcodage des noms de domaines en adresses IP 
correspondantes. De meme, chaque document du web est identifie par une 
chaTne de caracteres appelee URL (ou Universal Resource Locator en 
terminologie anglo-saxonne). 

30 Par exemple : 

http://www.xxx.com/abc/divers/mapage.html 
correspond a TURL de la page intitulee mapage, decrite en HTML, situee 
dans le sous-repertoire clivers du repertoire abc du serveur web 
www.xxx.com. 

35 Le web offre une facilite de navigation et une grande 

conviyialite grace a la presence de liens dont la selection, notamment en 
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cliquant dessus, dans une page decrite en langage HTML permet 
d'executer divers actions : 

• se deplacer sur une page (vers tin signet) ; 

• se deplacer vers une autre page du document (meme 
serveur, liens internes) ; 

• envoyer des messages vers une boite de reception de 
courrier electronique (e-mail en terminologie anglo-saxonne) ou 

- se deplacer vers une page d'un autre serveur web (lien 

externe). 

Un lien externe vers la page par defaut du sous-repertoire 
divers du repertoire abc du serveur www.xxx.com s'ecrit en langage HTML : 
<a href = "http://www.xxx.com/abc/divers/"> 
Les liens se presentent par defaut sur la page HTML comme 
un texte de couleur bleue souligne. Ce texte incorpore au code de la page a 
la suite du lien est terminee par la chaine de caracteres : 

<a/> 

D'autres presentations peuvent etre declarees (telles que 
d'autres couleurs, images, etc.). Lors du passage sur un lien, le curseur se 
transforme en un dessin representant une main pointant vers le haut. 

Ce mode de navigation dans lequel I'utilisateur n'a pas a 
connaitre, ni, a fortiori, a saisir les URL, confere une convivialite sans egale 
au web. Toutefois, si les liens pointent vers une adresse erronee, on obtient 
I'affichage d'une page non desiree, alors que si I'URL du lien n'est pas 
valide, se produit Terreur 404 du protocole HTTP avec I'affichage d'un 
message du type : 

FILE NOT FOUND 

The requested URL/xyz.htm was not found on this server. 

Une telle erreur provient exceptionnellement d'une erreur de 
saisie de I'URL du lien ou, plus frequemment, d'une page qui a ete deplacee 
ou supprimee. On parle alors d'un lien casse. L'apparition d'un tel message 
compromet gravement la convivialite de " la consultation. Cela est 
particulierement vrai pour les liens externes pour lesquels le responsable 
du site web (webmaster en terminologie anglo-saxonne) n'a pas d'outil de 
controle de coherence des liens et n'est pas necessairement informe du 
changement des adresses des pages designees par les liens. Pour remedier 
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a ce probleme, on a propose de remplacer les liens par des noms 
symboliques invariants URN ou Universal Resource Name en terminologie 
anglo-saxonne. Un ou des serveurs assurerait la traduction des URN 
invariants en URL. Ainsi, seul le ou les serveurs de noms connaTtrait 

5 ('emplacement physique des documents, evitant ainsi que cette information 
soit stockee de fa?on redondante par tous les serveurs qui en font I'usage. 
Ce serveur de nom serait plus facile a mettre a jour. Une telle solution n'a 
jamais ete adoptee sur INTERNET car elle presente de nombreux 
inconvenients. D'une part, pour se connecter a un site, il faudrait tout 

10 d'abord se connecter au serveur de noms, ce qui doublerait le nombre de 
connexions et, par suite, le temps d'obtention de reformation desiree. De 
plus, le serveur de noms serait interroge par de tres nombreux serveurs 
web et deviendrait un goulot d'etranglement extremement penalisant pour 
la transmission de ('information. 

15 PITKOW : "Supporting the web : A distributed hyperlink 

database system", Computer Networks and ISDN Systems, Vol. 28, n° 11, 
mai 1996, pages 981-991, decrit ('incorporation a un serveur Web d'un 
serveur "Atlas" susceptible de communiquer avec d'autres serveurs "Atlas" 
incorpores a d'autres serveurs Web pour leur indiquer les changements de 

20 pages. Ainsi, chaque serveur Web doit comporter un serveur "Atlas". Au 
contraire, le systeme selon la presente invention peut comporter un unique, 
serveur de lien assurant le fonctionnement d'un tres grand nombre de 
serveurs Web. 

C'est par consequent un but de la presente invention d'offrir 
25 un systeme informatique permettant d'eviter ('apparition de liens casses, 
notamment sur le World Wide Web. 

C'est egalement un but de la presente invention d'offrir un 
tel systeme generant un faible trafic sur le reseau. 

C'est egalement un but de la presente invention d'offrir un 
30 systeme ayant une grande securite de fonctionnement. 

C'est aussi un but de la presente invention d'offrir un. 
systeme permettant de mettre a jour les signets designant les sites favoris 
au niveau des logiciels de navigation des postes de consultation individuels. 

Ces buts sont atteints par un systeme informatique selon la 
35 presente invention comportant un serveur de changement de liens qui 
collecte I'information sur les pages, notamment en langage HTML 
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comprenant des liens, de preference externes, sur les modifications des 
adresses de pages ainsi que sur les suppressions de pages. Lors d'une 
modification ou d'une suppression de page, le serveur de changement de 
liens informe les serveurs web concernes designant les anciennes adresses 
des pages. 

Avantageusement, la collecte d'informations sur les pages 
comportant des liens est realisee en cooperation avec le serveur web 
hebergeant ces pages. 

Avantageusement, le changement notifie est execute 
automatiquement sur le serveur hebergeant la page comportant le lien a 
modifier. 

La presente invention sera mieux comprise au moyen de la 
description ci-apres et des figures annexees donnees comme des exemples 
non limitatifs et sur lesquelles : 

- la figure 1 est un schema de quelques ordinateurs 
connectes a I'lNTERNET comportant des liens valides ; 

- la figure 2 est un schema analogue des ordinateurs apres 
modification de liens ; 

• la figure 3 est un diagramme de flux illustrant le 
fonctionnement d'un module appele emetteur assurant le recensement de 
liaisons a surveiller ; 

- la figure 4 est un schema de flux d'un processus de 
reception de notification de changement de liens ; 

- la figure 5 est un schema de flux du processus de 
reception de notification de modification des URL ; et 

- la figure 6 est un diagramme de flux d'un module assurant 
la reception de notification de changement d'URL. 

Sur les figures 1 a 6, on a utilise les memes references pour 
designer les memes elements. 

Sur les figures 1 et 2, on peut voir trois serveurs web 1, 3 et 
5 connectes par I'intermediaire de I'lNTERNET 7 a un serveur de liens 9, un 
poste de consultation de type classique 11 et un poste de consultation 13 
selon la presente invention. 

Les pages habitueliement publiees sur le web sont decrites 
dans le langage HTML et sont definies, d'une part par le nom et 
('emplacement du fichier stocke sur le serveur et, d'autre part, 
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eventuellement, par leur denomination incorporee dans le code de la page 
avec la balise <title>. Le serveur 1 permet d'acceder aux pages 1.1, 1.2, 
1.3, 1.4 et 1.5 decrites, par exemple, en langage HTML. 

Le serveur 3 permet d'acceder aux pages 3.1, 3.2 et 3.3 
decrites par exemple en langage HTML. Le serveur 5 permet d'acceder aux 
pages 5.1, 5.2 et 5.3 decrites par exemple en langage HTML. 

II est toutefois bien entendu que la presente invention n'est 
nullement limitee a I'emploi du langage HTML mais s'applique a toute 
description d'un contenu permettant de creer des liens notamment 
hypertextes, par exemple en utilisant les langages de description de pages 
SGML, XML, DHTML, ASP, le logiciel HYPERCARD® de la Societe APPLE ou 
un logiciel de gestion documentaire. 

La page 1.1 comporte un premier lien 15.1 permettant de 
remonter en haut de la page sans utiliser les barres de defilement. Un lien 
15.2 pointe vers la page 1.3. Les liens 15.1 et 15.2 sont des liens internes 
qui sont relativement faciles a gerer. D'une part, les logiciels de creation de 
sites peuvent incorporer des outils de gestion de coherence des liens 
internes. D'autre part, toutes les pages 1.1 a 1.5 sont normalement sous la 
responsabilite d'une meme personne, le webmaster du serveur web 1. 

Un lien 15.3 pointe de la page 1.1 vers la page 3.2 du 
serveur 3. Une liaison 15.4 pointe de la page 1.1 vers la page 3.1 du 
serveur 3. Une liaison 15.5 pointe de la page 1.1 vers la page 5.3 du 
serveur 5. Les liaisons 15.3 a 15.5 sont des liaisons externes dans la 
mesure ou elles pointent vers des pages stockees sur d'autres serveurs que 
le serveur 1 hebergeant la page 1.1. Un utilisateur utilisant un poste de 
consultation 11, typiquement un micro-ordinateur muni d'un logiciel de 
navigation et de consultation de pages comme par exemple INTERNET 
EXPLORER, peut se connecter au serveur 1 et afficher sur son poste la page 
1.1. Les liens 15.1 a 15.5 facilitent la navigation dans I'information. 

D'autres liens, non illustres, peuvent pointer vers des 
images, vers des applets JAVA ou autres. Un lien pointant vers I'image 
moi.gif du repertoire abc du serveur www.xxx.com s'ecrit en HTML : 
<img src = "http://www.XXX.com/abc/moi.gif"> 

En cliquant sur un des liens, I'utilisateur change de page ou 
d'endroit sur la page et cela sans connaitre ni sans avoir a saisir les URL 
des divers pages designees par les liens 15.2 a 15.5 ni le signet pointe par 
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le lien 15.1. Cette situation peut etre perturbee, comme illustre sur la 
figure 2, par la disparition ou le emplacement de certaines pages designees 
par des liens, notamment externes. De plus, I'emplacement de certaines 
pages sur des serveurs web n'est conserve que pour justement eviter de 
provoquer une cassure de liens designant ces pages. Le serveur hebergeant 
ces pages ayant evolue, le webmaster fige la structure pour eviter de casser 
des liens. 

Dans I'exemple de la figure 2, le lien 15.3 est casse car la 
page 3.2 a ete supprimee. Le contenu de la page 5.3 a ete deplace vers la 
page 5.1 du serveur web 5. Le contenu de la page 3.1 est deplace vers la 
page 5.5 du serveur web 5. 

Ainsi, un utilisateur de la station 11 de consultation 
connecte a I'lNTERNET verra sa consultation perturbee si les liens 15.3, 
15.4 et 15.5 ne sont pas mis a jour. Cette mise a jour n'est pas facile dans 
la mesure ou le webmaster des ordinateurs 3 et 5, sans des recherches tres 
lourdes sur le web ne peuvent pas savoir quels sont les liens qui pointent 
vers les pages hebergees par leurs serveurs. 

Selon la presente invention, on genere et maintient a jour 
une liste des liens permettant d'avertir en cas de modification ou de 
suppression de page (serveurs 3 et 5) le serveur (1) presentant des liens 
pointant vers les pages deplacees ou inexistantes. 

Apres rectification, le lien 15.3 porte sur la figure 2 la 
reference 15.3'. Apres rectification, le lien 15.4 porte sur la figure 2 la 
reference 15.4'. Apres rectification, le lien 15.5 porte sur la figure 2 la 
reference 15.5'. Apres rectification, le lien 15.6 porte sur la figure 2 la 
reference 15.6'. 

Selon I'exempie prefere de la presente invention, un serveur 
de liens 9 stocke et maintient a jour la liste de liens externes sur 
INTERNET, notamment sur le World Wide Web. En cas de changement 
d'une page pointee, il avertit les serveurs concernes comportant des liens 
pointant vers cette page. Avantageusement, la liste est generee et/ou 
maintenue de maniere cooperative avec les serveurs web qui declare la 
creation, la modification, la destruction ou le deplacement de pages, ainsi 
que les pages pointees par les liens des pages hebergees. Cette cooperation 
est particulierement importante pour les serveurs avec restriction d'acces, 
notamment avec les serveurs INTRANET ou les serveurs exigeant un mot de 
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passe d'acces pour lequel I'exploration de pages par un robot 
informatique, et par suite ^extraction des liens des pages hebergees, ne 
sont pas possibles. Dans une variante de realisation, les logiciels de 
navigation des postes de consultation 13 declarent egalement au serveur de 
5 liens 9 les sites favoris ou les signets de consultation sur le web ainsi que, 
eventuellement, leurs adresses de messagerie electronique. En cas de 
changement d'adresse d'un site ou des pages d'un site, le serveur 9 signale 
aux postes de consultation 13 muni d'un logiciel de navigation selon la 
presente invention les mises a jour a effectuer ou, en cas de connexion 

10 directe au serveur 9, effectue le changement. 

Par exemple, le poste de consultation 13 comporte un 
raccourci 15.6 vers la page 3.1 du serveur web 3. Apres notification par le 
serveur de liens 9, le raccourci 15.6' du poste de consultation 13 pointe 
vers la page 5.5 du serveur web 5. 

15 Par contre, un meme lien 15.6 vers la page 3.1 partant d'un 

poste de consultation 11 de type connu n'est pas modifie automatiquement. 
et par suite pointe vers une page qui n'est plus pertinente. 

En variante, lors de la detection d'un lien casse (erreur 
HTTP 404), le logiciel de navigation n'affiche pas les messages associes 

20 mais se connecte au serveur de liens 9 pour lire la nouvelle adresse de la 
page a pointer. Ainsi, le serveur de liens 9 n'est consulte que pour des liens 
casses, ce qui limite le trafic sur INTERNET 7. 

Avantageusement, le systeme informatique selon la 
presente invention comporte un module emetteur d'informations sur les 

25 liens installe sur les divers serveurs web, illustre sur la figure 3, un serveur 
de liens 9 muni d'un module de reception d'informations sur les liens 
illustres sur la figure 4, un module d'acquisition ou de reception 
d'informations sur la modification des pages sur les divers serveurs web, 
illustre sur la figure 5 et des modules recepteurs illustres sur la figure 6, 

30 avantageusement repartis sur les divers serveurs web assurant la reception 
d'informations concernant les pages modifiees pointees par les liens du 
serveur recepteur. 

Le module recepteur de la figure 3 comporte une etape 16 
de stockage dans un fichier difference A de I'historique des modifications 

35 des adresses de pages. En variante, toute modification (suppression, 
deplacement) de page est immediatement notifiee au serveur de lien 9 sans 
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attendre ('elaboration du fichier A de balayage de toutes les pages 
hebergees a la recherche des liens a traiter. De preference ce balayage est 
I i mite aux liens externes. On va en 17. L'etape 17 de balayage consiste par 
exemple en la recherche dans le code des pages de la chaine de caracteres 
du type : 

<a href = protocole://serveur/repertoire/fichier> 
ou : 

protocole designe le protocole utilise, par exempie HTTP ; 

serveur designe I'adresse ou la designation du serveur 
d'hebergement ; 

repertoire designe le repertoire et les eventuels sous- ~ 
repertoires de stockage du fichier de code ; et 

fichier designe le nom du fichier de code formant la page. 

On va en 19. 

En 19, on etablit la liste a I'instant i de tous les liens a 
traiter (notamment des liens externes). 

La liste i comporte egalement les emplacements logiques 
correspondant aux divers pages HTML. 

On va en 21. 

En 21, on verifie s'il existe une liste anterieure. 
Si oui, on va en 23. 
Si non, on va en 25. 

En 23, on compare la liste actuelle (liste i) avec la liste 
precedente (liste i-1) et on stocke la difference dans un fichier de difference 
A. 

On va en 27. 

En 25, on stocke la liste actuelle (liste i) dans le fichier 

difference A. 

On va en 27. 

En 27, on transmet la liste A au serveur de liens 9. En 
variante, la liste A, eventuellement completee par I'historique plus ou moins 
complet des evolutions des diverses pages hebergees par le serveur est 
mise a la disposition pour consultation par I'intermediaire de ('INTERNET. 

La liste A comporte par exemple des messages d'ajout de 
pages, concernant les nouvelles pages ajoutees, les modifications de pages 
concernant des pages renommees ou deplacees, les suppressions de pages 
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concernant les pages supprimees, les ajouts de liens concernant les 
nouveaux liens externes crees, la modification de liens indiquant les liens 
modifies et la suppression de liens concernant les liens supprimes. Par 
exemple, le serveur 3 avertit le serveur de liens que la page 3.2 a ete 
supprimee et que la page 3.1 a ete modifiee alors que le serveur web 5 
indique les pages 5.1 et 5.3 ont ete modifiees et que les pages 5.4 et 5.5 
ont ete ajoutees. 

La transmission 27 peut s'effectuer par courrier 
electronique, la procedure peut s'effectuer de maniere automatique ou 
apres validation par le webmaster de I'emetteur pour verifier la coherence, 
I'exactitude et I'absence d'informations confidentielles dans la notification 
au serveur de liens 9. 

La transmission peut egalement s'effectuer selon le 
protocole de transmission reseau TCP/IP, notamment sur interrogation du 
serveur web par le serveur de liens 9. 

La transmission 27 peut aussi s'effectuer par un protocole 
de haut niveau de type HTTP. Par exemple, le serveur de liens 9 se 
connecte au serveur web et execute un script standard, par exemple selon 
le standard denomme en terminologie anglo-saxonne Common Gateway 
Interface ou CGI et execute avantageusement un script de preference ecrit 
en langage PERL qui est particulierement optimise pour la manipulation de 
chames de caracteres arbitraires. Le script affiche la liste du fichier A qui 
est recuperee par le serveur de liens 9. Le serveur de liens 9 parcourt tous 
les serveurs web declarant comporter un module emetteur. Le fichier A est 
avantageusement efface sur le serveur Web. 

D'une maniere generale la transmission 27 peut s'effectuer 
par tout protocole comprehensible par le destinataire, comme par exemple 
la synthese vocale, une telecopie, un message sur un recepteur d'appel de 
personne (pager en terminologie anglo-saxonne) ou un message court 
(Short Message System ou SMS en terminologie anglo-saxonne) adressee 
au webmaster du serveur concerne. 

Sur les figures 4 et 5, on a illustre le fonctionnement du 
serveur de liens 9. 

En 29, le serveur assure la reception, par courrier 
electronique, transmission en mode TCP/IP ou en mode HTTP des fichiers 
A. 
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On va en 31. 

En 31, le serveur de liens 9 effectue la mise a jour de la 
base de donnees 32 des liens, notamment externes sur le World Wide Web. 
En variante, il report egalement les declarations des signets ou favoris des 
5 logiciels de navigation de poste 13 selon la presente invention. 

En 33 (figure 5) le serveur de liens regoit les notifications 
des modifications des URL des pages web. Les informations sur ces 
modifications peuvent etre incluses dans les fichiers A ou etre stockees et 
transmises separement. 

io En variante, en mode non cooperatif, le serveur de liens 9 

balaie les divers serveurs web pour constituer la liste des pages web, leur 
emplacement et les liens qu'elles contiennent. Cette liste peut egalement 
etre elaboree a partir de la base de donnees d'indexation de I'lNTERNET 
elaboree par les moteurs de recherche et comportant une indexation des 

is liens. Le serveur web 9 assigne avantageusement une signature compacte a 
la page. Cette signature inclut ta balise <title> parmi des pages HTML 
completee, de preference, par des donnees pertinentes d'identification de la 
page basees sur les occurrences des mots, des images, la mise en page 
employee et/ou par analyse semantique du texte ou le check sum, c'est-a- 

20 dire la valeur, par exemple ponderee, de la somme des valeurs des 
caracteres composant la page, de maniere a faciliter Identification des 
pages deplacees. 

En variante, le serveur 1 hebergeant des pages comportant 
des liens externes 15.3 a 15.5 vers des pages 3.1, 3.2, 5.3 hebergees par 

25 d'autres serveurs web 3, 5 leur notifie I'existence et la teneur de ces liens. 
En retour, un serveur 3, 5 deplagant 3.1, 5.1 ou supprimant 3.2, une page 
notifie ces changements aux serveurs les ayant informes qu'ils hebergent 
des pages presentant des liens diriges vers des pages modifiees. 
On va en 35. 

30 En 35, le serveur de liens 9 balaie la base de liens pour 

etablir une liste d'eventuels liens affectes par les changements ou 
suppressions des pages, c'est-a-dire la liste des pages comportant des liens 
qui sont desormais casses. 

On va en 37. 
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En 37, le serveur de liens 9 notifie aux serveurs web 
comportant les liens casses les modifications, deplacements ou 
suppressions des pages. 

Cette notification petit egalement s'effectuer par courrier 
5 electronique, notification en mode de transmission TCP/IP, transmission de 
type HTTP ou autre. 

Le fonctionnement d'un serveur web 1 notifie est illustre sur 

la figure 6. 

En 39, le serveur 1 re^oit une notification de changement 
10 des URL des pages designees par les liens 15.3 a 15.5. 

On va en 41. 

En 41, le webmaster effectue avantageusement, une 
validation des modifications proposees. En cas de refus de validation, on va 
en 43. Cette absence de validation peut provenir d'une incertitude sur 
15 1'origine du message regu en 39 ou de sa pertinence. 

En cas de validation, on va en 45. 

En 45, on effectue les modifications des URL dans les pages 

HTML 1.1 concernees. Le programme se termine en 43. 

Les modules emetteurs et recepteurs sur les divers serveurs 
20 1, 3 ou 5, peuvent etre effectues periodiquement, sur declenchement 

manuel du webmaster, notamment apres une modification des pages ou 

fonctionner en tache de fond avec activation notamment en cas de 

modification des pages HTML. Par exemple, sur le serveur tournant sur le 

systeme d'exploitation UNIX®, ces modules peuvent etre constitues par des 
25 programmes denommes DAEMON alors que sur les serveurs tournant sur le 

systeme d'exploitation WINDOWS NT®, il peut s'agir des modules 

denommes SERVICES. 

Avantageusement, en mode mixte cooperatif-non cooperatif, 

le robot parcourant le World Wide Web pour constituer une base de 
30 donnees sur les URL des pages HTML et des liens qu'elles comportent, evite 

I'exploration des serveurs cooperatifs ayant effectue une notification de liste 

A. 

En variante, lorsqu'un serveur 3 ou 5 modifie ou supprime 
une page, il effectue une connexion au serveur de liens 9 pour s'enquerir de 
35 la liste des serveurs 1 comportant des pages 1.1 comprenant des liens 
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15.3, 15.4, 15.5 pointant vers une page modifiee et effectue lui-meme les 
notifications au serveur 1. 

II peut severer extremement avantageux de munir le 
systeme selon la presente invention des dispositifs de securite empechant 
une fausse notification, notamment les notifications maiveillantes et/ou les 
tentatives pour creer des liens non desires. On peut utiliser tout systeme de 
securite de type connu, notamment ('authentication de I'auteur du 
message et de I'integrite du contenu. On peut par exemple crypter les 
messages par exemple avec des algorithmes de cryptage dit a cles 
publiques, telles que RSA ou DSA, PGP ou les protocoles PGP/Mime ou 
S/Mime. Les systemes de cryptographie a cles publiques sont notamment 
decrits dans US-A-4 200 770, US-A-4 218 582, US-A-4 405 829, US-A-4 
424 414 et US-A-4 995 082 ainsi que dans le livre "Applied cryptography", 
seconde edition, de Bruce Schneier. 

En variante, on peut egalement utiliser le mecanisme de 
rappel automatique (call-back en terminologie anglo-saxonne). Le serveur 
appele rappelle Temetteur du message avec incorporation d'un nombre 
aleatoire d'authentification. La reponse comporte le nombre aleatoire ou un 
nombre derive du nombre aleatoire d'authentification. 

La variante preferee de realisation de la presente invention 
tient compte du fait que, frequemment, I'administrateur d'un site Web, 
notamment de petits sites Web, dispose d'une copie locale de son site dans 
son ordinateur ou sa station de travail qui n'est pas connecte en 
permanence a Internet. Au contraire, le serveur du site Web y est connecte 
en permanence. Les modifications apportees aux pages de la copie locale 
sont telechargees sur le serveur Web proprement dit, par exemple par le 
protocole FTP. Dans un tel cas, I'administrateur charge sur I'ordinateur 
comportant la copie locale de son site un logiciel client assurant la 
cooperation avec le serveur de liens 9. 

L'administrateur s'enregistre sur le serveur de liens 9 en 
donnant I'adresse de son site Web (ex: http:// www.monserveur.com/ ou 
eventuellement un sous repertoire si le site est partage 
http://www.unserveur.com/monrepertoire/) et son adresse de courrier 
electronique (ex: monnom@monserveur.com). 

Ceci se fait soit directement en remplissant un formulaire 
sur le site Web du serveur de liens 9 soit en configurant le logiciel client. 
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Dans une premiere variante de realisation, I'elaboration de 
la liste des couples (emplacement de lien, lien) est effectuee par le logiciel 
client qui parcours I'ensemble des fichiers contenus dans la copie locale du 
site et extrait les balises du langage utilise, notamment du HTML 
correspondant a des liens. Pour chaque lien trouve, le logiciel client creait 
une nouvelle entree dans la liste comportant I'adresse que la page 
comportant le lien, aura sur le serveur Web proprement dit, associee a la 
valeur du lien. Une fois la liste elaboree, le logiciel client se connecte au 
serveur de liens 9, par exemple via un protocole HTTP et transmet la liste 
des couples (emplacement de lien, lien). 

Dans la variante de realisation preferee, le logiciel client 
etabli uniquement une liste des pages de son site et I'enregistre dans le 
serveur de liens 9. Pour faire cela, le logiciel client parcours I'ensemble des 
fichiers contenus dans la copie locale du site et se connecte au serveur de 
liens 9 via, par exemple le protocole HTTP passant I'adresse des pages 
parcourues en parametres. 

Si la connexion au serveur de liens 9 fonctionne, le fichier 
est copie dans un repertoire "Delta" (A), utilise plus tard a des fins de 
comparaison. 

Les serveurs de liens se connectent en HTTP aux pages 
ainsi enregistrees et les parcourent a la recherche de liens externes. Les 
liens externes trouves sont ajoutes a la base liens sous la reference du site 
Web de I'utilisateur 3. 

Le serveur de liens surveille en permanence tous les liens 
enregistres appartenant a des serveurs non enregistres en se connectant via 
HTTP. 

Des qu'un lien est detecte casse ou deplace et ce, que ce 
soit par detection directe du serveur de lien 9 ou par notification d'un autre 
utilisateur via le serveur de liens 9, un message electronique est envoye a 
I'utilisateur 3 lui demandant de se synchroniser avec le serveur de liens. 

L'administrateur 3 qui recpoit un message de notification lui 
demandant de se synchroniser utilise le logiciel client pour se connecter en 
HTTP au serveur de liens. La date de demiere mise a jour du "client" est 
passee en parametre lors de la connexion et toutes les modifications 
posterieures a cette date et relatives au site courant sont transmises au 
"client" en format HTML. 
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Le logiciel client interprete le code HTML retourne a I'etape 
precedente et applique les modifications correspondantes a la copie locale 
des fichiers du site. II le fait soit en supprimant les liens (pages 
supprimees) ou en rempla?ant les liens (pages deplacees) et ce apres 
5 validation par I'administrateur. 

L'administrateur travaille sur la copie locale de son site 
supprimant, ajoutant, depia?ant ou modifiant le contenu de ses pages. 

L'administrateur met a jour son site Web proprement dit 
connecte en permanence a INTERNET en copiant (via FTP par exemple) la 
10 copie locale des fichiers vers son site. 

L'administrateur utilise le logiciel client pour signaler tous 
changements appliques a son site. 

Le logiciel detecte les pages ajoutees, supprimees, 
deplacees ou modifiees par comparaison du repertoire "Delta" (A) et de la 
is copie locale du site. 

Ces informations peuvent etre verifiees et modifiees par 
Padministrateur. 

Le logiciel client se connecte au serveur de lien 9 en HTTP 
pour signaler les modifications. 

20 Le serveur de liens verifie avantageusement la validite des 

informations transmises a I'etape precedente en se connectant en HTTP via 
TINTERNET au site Web de l'administrateur. Les pages modifiees ou 
ajoutees sont parcourues pour determiner leurs liens externes. Pour les 
pages deplacees, on verifie que I'ancienne page n'existe plus et que la 

25 nouvelle existe. Pour les pages supprimees, on verifie que I'ancienne page 
n'existe plus, 

Cette etape a pour but d'eviter la falsification d'information 
et les risques de notifications fausses malveillantes. 

Les informations etant validees, on parcourt la base de liens 
30 et notifie par courrier electronique les sites concernes 1, 11, 13. 

En variante, l'administrateur peut s'enregistrer directement 
a partir de site Web proprement dit connecte en permanence a TINTERNET 
et y recevoir les notifications. 

Toutefois, il est bien entendu que le serveur 9 peut 
35 egalement effectuer la detection des deplacements et la suppression de 
pages sur des serveurs non enregistre sur le serveur de liens 9. Dans cette 
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procedure, on suppose que la coherence interne de chaque site Web est 
correctement assure, c*est-a-dire que les liens internes sont mis a jour en 
cas de deplacement d'une page interne au site Web. 

On parcourt le site Web jusqu'a trouver un lien interne vers 
la page pointee par le fien externe que Ton est susceptible de vouloir 
rectifier par la suite. On memorise I'adresse de la page contenant ce lien 
interne et le libelle du lien. 

Lorsque la page pointee n'existe plus (erreur HTTP 404) on 
se connecte a la page contenant le lien interne et determine la nouvelle 
adresse pointee par ce lien. Le lien interne ayant logiquement deja ete mis 
a jour par I'administrateur du site, on obtient ainsi la nouvelle adresse de la 
page resolvant de ce fait le lien externe. L'adresse pointee par le lien interne 
rectifie est notifiee comme lien externe corrige aux pages d'autres serveurs 
Web qui comportent un lien externe egale a I'ancien lien interne. 

La presente invention s'applique a tout systeme 
informatique comportant des liens, notamment externes, tels que systeme 
de gestion documentaire, reseau local, messagerie. 

La presente invention s'applique principalement aux pages 
comportant des liens sur le World Wide Web. 
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REVENDICATIONS 

1. Systeme informatique comprenant des moyens de 
stockage de donnees memorisant des liens et/ou raccourcis vers des pages 
d'affichage, des moyens d'identification automatiques des liens ou 
raccourcis memorises, des moyens d'elaboration et de stockage 
automatiques d'une liste de couples (emplacement du lien (1.1.), Men (15.3, 
15.4, 15.5)), et des moyens de mise a disposition de cette liste pour 
permettre, en cas de changement de I'adresse d'une page (3.1, 3.2, 5.3) 
pointee par un lien (15.3, 15.4, 15.5), de notifier ce changement en vue de 
la correction du lien (15.3', 15.4*, 15.5*) correspondant et comportant en 
outre des moyens de transmission de la liste de couples (emplacement du 
lien (1.1), lien (15.3, 15.4, 15.5)) vers un serveur (9) de lien recevant des 
listes de couples d'une pluralite desdits systemes informatiques. 

2. Systeme selon la revendication 1, caracterise en ce que 
ledit systeme est un serveur sur reseau, notamment un serveur sur 
INTERNET, de preference un serveur web (1) et en ce que les moyens 
d'identification des liens comportent des moyens de lecture du code des 
pages d'affichage et des moyens d'extraction des liens externes des pages 
d'affichage (1.1). 

3. Systeme selon la revendication 2, caracterise en ce que 
les pages d'affichage sont decrites dans le langage HTML ou XML. 

4. Systeme informatique selon la revendication 1, 
caracterise en ce que ledit systeme est un poste (13) de consultation en 
ligne de sites web (1, 3, 5) et en ce qu'il comporte des moyens de 
memorisation de raccourcis (15.6) vers des sites favoris ou vers des pages 
favorites. 

5. Serveur de liens caracterise en ce qu'il comporte des 
moyens d'elaboration d'une liste de liens et/ou des raccourcis pointant vers 
des pages du World Wide Web heberges sur une pluralite de systemes 
informatiques hebergeant des pages, des moyens de determination de 
changements d'adresses des pages pointees (3.1, 3.2, 5.3) et des moyens 
pour notifier a un systeme informatique (1, 13) hebergeant le support du 
lien ou du raccourci les changements d'adresses de la page pointee. 

6. Serveur de liens, caracterise en ce qu'il comporte des 
moyens de reception de notification des listes de couples [emplacements 
(1.1), lien (15.3, 15.4, 15.5)] transmises par un systeme informatique selon 
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la revendication 4 ou 5 et des moyens pour notifier a un systeme 
informatique (1, 13) hebergeant le support du lien ou du raccourci les 
changements d'adresses de la page pointee. 

7. Serveur selon la revendication 5 ou 6, caracterise en ce 
qu'il comporte des moyens de consultation de pages d'affichage publiees 
sur le web (1.1), des moyens detraction des liens externes incorpores 
dans le code desdites pages, des moyens d'elaboration et de stockage 
d'une liste de couple page d'origine (1.1), lien (15.3, 3.2 ; 15.4, 3.1 ; 15.5, 
5.3), ainsi que des moyens d'elaboration d'une liste des pages comportant 
des liens vers chaque page traitee. 

8. Serveur web selon la revendication 5, 6 ou 7, caracterise 
en ce qu'il comporte en outre des moyens de notification de changements 
d'adresses des pages web (3.1, 3.2, 5.3). 

9. Serveur selon la revendication 6, 7 ou 8, caracterise en ce 
qu'il comporte des moyens de consultation de pages web, des moyens 
d'identification de pages web, des moyens de stockage de couples 
(identification d'un page web, son adresse sur le web) et des moyens de 
comparaison des adresses des pages web anterieures avec des adresses 
des pages web actuelles pour en deduire une liste de 1'identification de 
pages web ayant change d'adresse accompagnees de leur adresse ainsi que 
des pages web ayant disparu. 

10. Precede de reparation de liens casses sur ('INTERNET, 
notamment sur le World Wide Web caracterise en ce qu'il comporte les 
etapes consistant a : 

■ recevoir les notifications des liens ou raccourcis pointant 
vers des pages web ; 

■ recevoir les notifications des modifications d'adresses des 

pages web ; 

• elaborer une liste de pages web pointant vers des pages 
ayant change d'adresse ; 

- notifier au systeme informatique hebergeant les liens 
pointant vers des pages web dont I'adresse a ete modifiee, le changement 
d'adresse des pages web pointees. 

11. Procede de reparation de liens ou raccourcis casses 
caracterise en ce qu'il comporte les etapes consistant a : 
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- consulter les pages web accessibles sur le world wide web 
et en extraire les liens externes pointant vers des pages web hebergees sur 
d'autres sites ; 

• memoriser les adresses des diverses pages web pointees 
5 par des liens ou des raccourcis ; 

• elaborer une liste de pages web pointant vers des pages 
ayant change d'adresse ; 

• notifier au systeme informatique hebergeant les liens 
pointant vers des pages web dont I'adresse a ete modifiee, le changement 

10 d'adresse des pages web pointees. 

12. Procede selon la revendication 11, caracterise en ce 
qu'il comporte, en outre, une etape de modification de liens pointant vers 
des pages web dont I'adresse a ete modifiee vers les adresses 
correspondantes notifiees. 

15 13. Procede selon la revendication 10 ou 12, caracterise en 

ce qu'il comporte, en outre, une etape de notification a un serveur 
hebergeant des liens pointant vers des pages dont I'adresse a ete modifiee, 
isole par des moyens de restriction et d'autorisation d'acces, notamment a 
un serveur INTRANET. 

20 14. Procede selon la revendication 10, 11, 12 ou 13, 

caracterise en ce qu'il comporte les etapes consistant a : 

• memoriser un lien externe a proteger ; 

- rechercher sur le serveur Web hebergeant la page pointee 
par ce lien des pages comportant un lien interne vers la page pointee ; 

25 ■ memoriser au moins un emplacement du lien interne 

associe a ce lien ; 

- en cas de disparition de la page pointee se connecter au 
serveur Web et lire le nouveau lien remplagant de lien vers la page pointee ; 
et 

30 • utiliser ou notifier le nouveau lien interne comme le 

nouveau lien correct pointant vers la page pointee par Pancien lien casse. 
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